Предположим, что уравнение при помощи некоторых тождественных преобразований приведено к виду .
Заметим, что такое преобразование можно вести разными способами, и при этом будут получаться разные функции в правой части уравнения. Уравнение эквивалентно уравнению при любой функции . Таким образом, можно взять и при этом выбрать функцию (или постоянную) так, чтобы функция удовлетворяла тем свойствам, которые понадобятся нам для обеспечения нахождения корня уравнения.
Для нахождения корня уравнения выберем какое-либо начальное приближение (расположенное, по возможности, близко к корню ). Далее будем вычислять последующие приближения
Заметим: тот факт, что --
корень уравнения , означает,
что есть абсцисса точки пересечения графика с прямой
. Если же при каком-либо вычислено значение и взято в
качестве нового аргумента функции, то это означает, что через точку графика проводится
горизонталь до прямой , а оттуда
опускается перпендикуляр на ось . Там и
будет находиться новый аргумент .
Проследим, как изменяются последовательные приближения при различных вариантах взаимного расположения графика и прямой .
1). График
расположен, по крайней мере в некоторой окрестности корня, включающей начальное
приближение , в некотором
угле со сторонами, имеющими наклон менее к
горизонтали (то есть стороны угла -- прямые , где
):
Если предположить вдобавок, что функция имеет
производную , то этот
случай соответствует тому, что выполнено неравенство , при , близких к корню . Проследим в этом случае за поведением последовательных
приближений
Мы видим, что каждое следующее приближение будет в этом случае расположено ближе к корню , чем предыдущее приближение . При этом, если график при лежит ниже горизонтали , а при -- выше её (что, в случае наличия производной, верно, если ), то приближения ведут себя монотонно: если , то последовательность монотонно возрастает и стремится к , а если , то монотонно убывает и также стремится к . Если же график функции лежит выше горизонтали при и ниже её при (это так, если ), то последовательные приближения ведут себя иначе: они "скачут" вокруг корня , с каждым скачком приближаясь к нему, но так же стремятся к при .
Заметим, что если функция не
монотонна в окрестности точки , то
последовательные приближения могут вести себя нерегулярно (то есть не монотонно
и не оказываясь попеременно то левее, то правее корня, а делая скачки
относительно корня при произвольных номерах (см. следующий чертёж):
2). График
расположен, по крайней мере в некоторой окрестности корня, вне некоторого угла
со сторонами, имеющими наклон более к
горизонтали (то есть стороны угла -- прямые , где
):
Если функция имеет
производную , то в этом
случае при , близких к
корню , выполнено
неравенство .
Каждая следующая итерация будет в этом случае расположена дальше от корня , чем предыдущая, . При этом, в зависимости от того, пересекает ли график прямую "снизу вверх" или "сверху вниз" (см. рис.), последовательность монотонно удаляется от корня или же итерации удаляются от , оказываясь попеременно то справа, то слева от корня.
Ещё одно замечание: если не выполнено ни условие , ни
условие , то
итерации могут
зацикливаться. На чертеже ниже приведён пример зацикливания, когда уравнение
имеет вид .
Мы видим, что для сходимости итераций к корню, вообще говоря, не обязательно наличие производной у функции . Однако метод итераций гораздо удобнее формулировать в терминах, связанных со значениями производной. Именно так мы и сформулируем наши наблюдения в виде теоремы.
При этом скорость сходимости задаётся неравенствами
Доказательство. Пусть . По формуле конечных приращений, применённой к отрезку между точками и , получаем
Неравенство очевидно, поскольку из того, что и лежат в окрестности длины , следует, что .
Поскольку
Выше мы отмечали, что привести уравнение к виду можно, выбирая в виде , где -- произвольная функция. При различных способах выбора получаются разные модификации метода итераций, которые имеют отличающиеся свойства: разную скорость сходимости (но не меньшую той, что гарантирована теоремой) и разную потребность в вычислении значений функции или , а также их производных.
Отметим самые употребительные из этих методов.